2024年最能搞事的巨头,依然是OpenAI。
先是创始人兼CEO奥特曼,透露预计筹集7万亿美元,用来提高全球芯片制造能力。
7万亿美元,都能把苹果、微软、谷歌一起打包买走了。
相比天文数字,更让人震惊的是OpenAI的另一件事。
2月16日凌晨,它的首个文生视频模型Sora正式亮相,并发布了几段AI生成的视频,最长60秒。
AI视频,从此达到了以假乱真的程度。
看到这些视频,普通人直呼“现实,不存在了”,同行们则全萎了。
明星AI公司Stability AI,原本也发布了一个新的视频模型,但看到Sora的视频后,官方火速删除了自家推文。
另外一家公司Runway,创始人感慨:过去要干一年的活,现在被它几天、几小时就干完了。
马斯克则到处留言“人类愿赌服输(gg humans)”。
央视也被惊动,有多个频道都对Sora进行了全天候报道。
对于Sora,目前全程高兴的只有两种人。
一个是老色批,他们已经快进到“MR头显+AI创作剧情”的联想了。
一个自然是OpenAI,再次逼疯同行后,其估值达到800亿美元,还可能飙升。
只能生成60秒视频的Sora,凭啥这么值钱?
发布2个小时,让对手损失上亿
在AI生成视频的领域,OpenAI不是第一个吃螃蟹的。
不一样的是,之前的AI视频公司,它们做的AI生成视频,基本只有几秒,而且模糊不清,还有明显的违和感。
比如去年,AI生成的一个外国男明星吃意大利面的视频,一眼假。
所以不少大佬都说在AI生成视频方面,我们还有很长的路要走。
但它的商业价值,没能人否认。
此前业内最知名的Runway,最多只能生成18秒的视频,但凭这手功夫,Runway参与了奥斯卡获奖影片《瞬息全宇宙》的制作,估值一度达到15亿美元。
还有一家去年底成立的创业公司Pika,靠其文生视频大模型轰动一时。这家只有4个人的公司,半年时间完成了三轮融资,估值飙升到2.5亿美元。
只是没想到,横空出世的Sora,一夜搅没了所有人的美梦。
Runway的CEO第一时间在网上说了两个字:“Game On(竞争开始了).”
另一家AI视频公司Stability的CEO甘拜下风:“奥特曼真是个魔术师。”
美国图片供应商Shutterstock,被跨界打击,在Sora发布的2小时,其市值损失了约7000万美元。
更惨的是谷歌,秒变科技界的汪峰。
因为就在Sora发布的同一天,谷歌也重磅发布了新一代多模态大模型Gemini 1.5 Pro,在性能上完全秒杀OpenAI的GPT-4 Turbo。
这本该是谷歌扬眉吐气的一天,却被Sora抢走了所有头条。
能让所有公司黯然失色,Sora太颠覆了。
别人还在用AI费劲地生成4秒动图,Sora随意生成60秒的高清大片。
其他AI生成视频充满山寨感,Sora甚至能生成电影级别的场景,以假乱真。
连“同一场景”下的多机位视频,Sora都整出来了。
无论是视频时长、画面精细度,还是细节完整性,不论是一镜到底还是多机位无缝切换,Sora的表现都可以用碾压对手来形容。
有人用相同的提示词,对比Sora和其他同类产品生成的视频,差距一目了然。
更关键的是,使用Sora的门槛极低。
从官方发布的宣传视频看,你只需要输入“构成元素、环境、行为及发生顺序、视频风格”等提示词,就能生成不同风格的高清、连贯、具有丰富运镜和转场的60秒视频。
所以,用它生成其他风格的虚拟视频也很容易,比如3D或动漫风。
同时还能根据要求,直接生成不同尺寸的视频,适配不同设备的屏幕。
说不定很快,人人都能有个导演梦。
Sora价值千亿的底气,不是秘密
其实Sora还有很多明显的弱点。
OpenAI指出,它可能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系。
比如这个视频里,老人吹蜡烛前后,火苗没有丝毫变化,不合常理。
酒杯摔碎,但是液体的流动和玻璃的破裂关系,也不合理。
一个人在跑步机上倒着跑步,更不合理。
对于AI来说,现实世界里再简单、再自然的现象,它可能都需要学习才能理解和还原。
去年很火的“AI绘画”,一开始也有类似毛病。
让它画一幅“在地上睡”的图,呈现出的可能是“地板+枕头+人头”,以为把脑袋放在枕头上就是睡觉。
还有人发现,AI绘画总是不能让人物老老实实地吃拉面。用什么工具吃面,一口吃几根,AI都需要学习。
但AI绘画技术很快迭代,不再智障,反而成了工作利器。
一名做插画设计相关工作的人表示,用了AI绘画后,工作更高效了,“现在甲方给我一个主题,我可以同时给他生成七八张图。”
现在还有明显硬伤的Sora,也有快速迭代的能力。
这主要得益于它理解长文的能力,这也是OpenAI本来就有的杀手锏。
比如在输入端,OpenAI利用GPT,先将用户输入的提示词进行精准的详尽扩写,然后再将扩写后的提示词交给Sora,让Sora能更好地遵循提示词来生成精准的视频。
所以相比以往的AI视频生成,只能死板地翻译文案,接着生成死板的视频,Sora不光能理解文案,还能基于文案自行发挥,让视频变得更自然、更精彩。
就好像这个视频,在完成主题的前提下,Sora又自动进行了多次镜头转换。
有了更好的理解能力,才能有更好的逻辑能力。
因此,在理解和掌握了更多现实世界的现象以及规律后,Sora生成的视频会越来越接近真实。
行驶中的列车窗外偶遇遮挡,车内人物倒影的短暂出现,十分惊艳。
也可以来一段好莱坞大片质感的电影预告片。
近景视角下,镜头细节拉满。
这也是为什么,OpenAI把Sora定义为“世界模拟器”。
除了接近真实,Sora还能实现人类的非现实脑洞。举个例子,根据提示词“一个杯子里两艘海盗船战斗的逼真近距离视频”,它生成了这样的视频。
难怪很多网友直呼要失业了,影视、广告、游戏等很多行业都会被冲击。
不少人还认为,连抖音、TikTok等短视频平台也要有危机感了。
毕竟AI生成视频一旦踏入正轨,输出源源不断,再加上AI还能更好地理解人类的成瘾机制,如果OpenAI推出自己的短视频平台,很可能成为一方霸主。
OpenAI可能存在的野心,越来越吓人了。
从巨亏到狂赚,它为何成了巨头的噩梦?
作为近两年的科技界顶流,有段时间,OpenAI并不被看好。
在其创立的前几年,OpenAI毫无盈利能力,全靠金主爸爸养活。
以至于曾有商业报告称,OpenAI仅运行其人工智能服务ChatGPT每天就要花费约70万美元,OpenAI目前正处于烧钱的状态,若不加速自身商业化进程,很有可能在2024年底不得不申请破产。
但OpenAI用行动表示:不是不会赚钱,只是还不想赚钱。
去年下半年开始,OpenAI加速商业化。创始人介绍,截至去年11月,有92%的财富500强公司在使用OpenAI的产品。整个2023年,OpenAI的收入突破了20亿美元。
与此同时,其最著名的产品ChatGPT,周用户量达到了1亿。
随之而来的是它水涨船高的估值,从去年年初的300亿美元暴涨到如今的800亿美元,在创业公司里仅次于字节跳动和SpaceX。
不过,比起赚钱能力和飙升的估值,OpenAI身上还有更让巨头忌惮的特质。
那就是开创风口的能力。
过去14个月,OpenAI始终是风口中的顶流。
从AI聊天,到AI绘画,再到AI生成视频,OpenAI的每次亮相似乎都在打脸巨头。
ChatGPT刚一亮相,吓得谷歌紧急推出AI加持的搜索引擎Bard,结果出师不利,当天股价大跌7.4%,市值蒸发1024亿美元。
Sora只是发出几段AI视频,抢走了所有科技版头条,让已经耕耘良久的同行自惭形秽。周鸿祎还在微博发长文表示,Sora意味着AGI实现将从10年缩短到1年。
如今火热的生成式AI市场,可以说离不开OpenAI的一步步推波助澜。
一个创业公司,抢先开创风口、放大市场,隐隐有成为新巨头的迹象,足以成为当下所有巨头的噩梦。
但与其眼红OpenAI不断开创风口,巨头们更该做的是反思。
前搜狗CEO王小川曾评论说:“OpenAI的成功,首先是技术理想主义的胜利。中国需要自己的OpenAI,就需要技术理想主义。大厂受自己的业务牵引,追逐资本热点的创业公司更动作变形。”
其实不论国内外,这个问题都存在。
在发展中,技术和创新的重要性不知不觉退居到了第二位,一切动作变成了为收入服务。
OpenAI就像曾经的影子,提醒它们必须想起久违的拼劲。
从ChatGPT到Sora,在AI的冲击面前,许多行业里的普通人都开始有危机感,巨头也别妄想能继续躺平。